Trong thế giới toán học, có những mối quan hệ là 'tuyệt đối', ví dụ như khi bán kính hình tròn được xác định thì diện tích sẽ ngay lập tức cố định. Nhưng trong đời thực, nhiều mối quan hệ lại mang tính 'lệch lạc': cha cao thì con trai thường cũng cao hơn, nhưng mối liên hệ này không phải là một ánh xạ duy nhất. Chính điều đó là điểm hấp dẫn củamối quan hệ tương quanđiểm hấp dẫn. Nó mô tả sự tồn tại của một xu hướng nào đó giữa các biến số, nhưng vẫn cho phép sự dao động ngẫu nhiên. Biểu đồ tán xạ chính là công cụ 'kính hiển vi' để phát hiện những xu hướng tiềm ẩn này.
Phân tích khái niệm cốt lõi
Mối quan hệ tương quan (Correlation) là chỉ mối quan hệ không chắc chắn giữa các biến số. Khi một biến số đã được xác định giá trị, biến số còn lại vẫn có thể thay đổi một cách ngẫu nhiên. Trong khi đó, mối quan hệ hàm số là tính xác định, $y$ hoàn toàn được xác định bởi $x$.
Thông qua việc quan sát biểu đồ tán xạ (Scatter Plot), chúng ta có thể trực quan đánh giá mối liên hệ giữa các biến số:
- Tương quan dương (Positive): toàn bộ có xu hướng 'dâng lên từ phải sang trái', khi $x$ tăng thì $y$ có xu hướng tăng.
- Tương quan âm (Negative): toàn bộ có xu hướng 'sụt giảm từ phải sang trái', khi $x$ tăng thì $y$ có xu hướng giảm.
- Tương quan tuyến tính: các điểm tập trung gần một đường thẳng.
Sự tương quan không đồng nghĩa với nguyên nhân! Ngay cả khi biểu đồ tán xạ cho thấy sự tương quan mạnh, điều đó có thể do 'nguyên nhân chung' từ bên thứ ba hoặc chỉ đơn thuần là trùng hợp ngẫu nhiên. Trước khi đưa ra kết luận, suy luận logic khoa học quan trọng hơn rất nhiều so với việc quan sát hình ảnh.